☰
13.6.1 비정상성(Non-stationarity) 문제: 하위 정책이 변할 때 상위 정책이 겪는 학습 불안정성 해결 (Hindsight Replay 활용 등)
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 13. 계층적 강화학습과 스킬 발견 (Hierarchical RL & Skill Discovery)
/
13.6 계층적 학습의 주요 도전 과제와 미래 (Challenges & Future)
/
13.6.1 비정상성(Non-stationarity) 문제: 하위 정책이 변할 때 상위 정책이 겪는 학습 불안정성 해결 (Hindsight Replay 활용 등)
13.6.1 비정상성(Non-stationarity) 문제: 하위 정책이 변할 때 상위 정책이 겪는 학습 불안정성 해결 (Hindsight Replay 활용 등)